文本转语音

Resemble AI开源TTS Chatterbox ,性能直逼超越ElevenLabs

近年来,文本转语音(TTS)技术在人工智能领域的应用日益广泛,从智能助手到内容创作,TTS正在重塑我们与声音交互的方式。一款名为Chatterbox的开源TTS模型横空出世,凭借其卓越的性能和创新功能,迅速成为行业焦点。Chatterbox:开源TTS的革命性突破Chatterbox由Resemble AI开发,基于MIT许可证完全开源,允许开发者自由使用和修改。这款模型基于0.5B规模的LLaM

地表最强AI语音来了!Eleven v3 Alpha版震撼发布,会说话还能“演戏”

随着人工智能技术的飞速发展,文本转语音(TTS)领域迎来了新的里程碑。2025年6月5日,ElevenLabs正式推出其最新文本转语音模型 Eleven v3(Alpha版),被誉为“地表最强”的TTS模型。这款模型不仅能将文本转化为自然流畅的语音,还能通过精准的情感控制和多语言支持,模拟真实对话中的语气变化与非语言表达,为创作者和开发者提供了前所未有的语音生成体验。以下是AIbase对Eleve

Kyutai Unmute 发布!10秒定制语音,AI对话进入超低延迟时代!

法国 AI 实验室 Kyutai 近日推出了一款革命性的语音 AI 系统 Unmute,为文本大语言模型(LLM)赋予了强大的语音交互能力。这款高度模块化的语音模型以其智能对话、超低延迟和个性化定制功能引发业界热议。AIbase 综合整理最新信息,带您深入了解 Unmute 的技术突破与应用前景。模块化设计:为任何文本模型“加声”Unmute 的核心亮点在于其高度模块化的架构。开发者无需重新训练模

MiniMax Audio推Speech- 02语音模型,一次性可以输入20万字符

备受关注的音频技术创新者MiniMax Audio正式发布了其全新的Speech-02系列语音模型,支持30多种语音,一次性可以输入20万字符。<!-- notionvc: fdae198d-f9e2-4313-bbcb-747cd4c93a10 -->为用户带来更真实、更流畅、更便捷的音频体验。全新的Speech-02系列是本次更新的核心亮点。据官方介绍,该系列在多语言覆盖能力上实现

开源免费语音克隆模型ChatterBox AI,性能测试超ElevenLabs

人工智能语音技术领域迎来重大突破!加拿大初创公司Resemble AI近日发布其首款开源文本转语音(TTS)模型ChatterBox,采用MIT许可证。这一模型以其卓越的语音克隆能力、情绪控制功能和超低延迟特性,迅速成为行业焦点,甚至在盲测中超越了知名闭源模型ElevenLabs。ChatterBox的发布背景ChatterBox是Resemble AI在语音合成领域的最新成果,基于0.5亿参数的

Fish Audio推出OpenAudio S1:200万小时数据驱动的超自然语音模型

Fish Audio,一家专注于AI音频技术的领先企业,于2025年6月3日正式推出了其最新文本转语音(TTS)模型——OpenAudio S1。这一模型以其高度自然的语音输出和卓越的情感表现力,为语音生成技术树立了新标杆,旨在为开发者与企业提供高性能且成本效益优越的解决方案。突破性的规模与性能OpenAudio S1基于超过200万小时的音频数据集训练,能够精准捕捉多样的语言风格、口音及情感表达